Sonnet 4.6
https://www.anthropic.com/news/claude-sonnet-4-6
https://www.youtube.com/watch?v=2fHVTe7c--4
Claude Sonnet 4.5.iconSonnet 4.6は「Opus級の性能をSonnet価格で」というのが今回の最大のポイント。特にエージェント・PC操作・推論の分野での伸びが顕著で、4.5からの進化幅としてはかなり大きめ。ただしOpus 4.6が依然として強い領域(長文コンテキスト処理・超難問推論)もあります。​
2026/2/18リリース
Sonnet 4.6 vs Sonnet 4.5
主要ベンチマークの比較:
SWE-bench Verified(コーディング): 77.2% → 79.6%
OSWorld-Verified(PC操作): 61.4% → 72.5%(大きく改善)
ARC-AGI-2(新規問題解決): 13.6% → 58.3%(劇的な向上)
GDBval-AA-Elo(オフィス作業): 1,276 → 1,633 Elo 
Claude Codeのユーザーテストでは、約70%のケースでSonnet 4.6がClaude Sonnet 4.5より好まれた。 特に「過剰エンジニアリングが少ない」「指示への追従が改善」「ハルシネーション減少」が評価されています。
Sonnet 4.6 vs Opus 4.6
OSWorld-VerifiedでOpus 4.6が72.7%に対しSonnet 4.6は72.5%と、ほぼ同等。さらにオフィス作業ベンチマーク(GDBval-AA-Elo)と金融分析ベンチマーク(Finance Agent v1.1)ではSonnet 4.6がOpus 4.6を上回る。 
価格はOpus 4.6が$15/$75 per million tokensに対し、Sonnet 4.6は$3/$15と5分の1のコスト。 
​​​​​​​​​​​​​​​